56 research outputs found

    Generalized Variances Ratio Test for Comparing k Covariance Matrices from Dependent Normal Populations

    Get PDF
    New tests based on the ratio of generalized variances are presented to compare covariance matrices from dependent normal populations. Monte Carlo simulation concluded that the tests considered controlled the Type I error, providing empirical probabilities that were consistent with the nominal level stipulated

    The Bioinformatics Tools for Discovery of Genetic Diversity by Means of Elastic Net and Hurst Exponent

    Get PDF
    The genome era allowed us to evaluate different aspects on genetic variation, with a precise manner followed by a valuable tip to guide the improvement of knowledge and direct to upgrade to human life. In order to scrutinize these treasured resources, some bioinformatics tools permit us a deep exploration of these data. Among them, we show the importance of the discrete non-decimated wavelet transform (NDWT). The wavelets have a better ability to capture hidden components of biological data and an efficient link between biological systems and the mathematical objects used to describe them. The decomposition of signals/sequences at different levels of resolution allows obtaining distinct characteristics in each level. The analysis using technique of wavelets has been growing increasingly in the study of genomes. One of the great advantages associated to this method corresponds to the computational gain, that is, the analyses are processed almost in real time. The applicability is in several areas of science, such as physics, mathematics, engineering, and genetics, among others. In this context, we believe that using R software and applied NDWT coupled with elastic net domains and Hurst exponent will be of valuable guideline to researchers of genetics in the investigation of the genetic variability

    Aplicação da análise de agrupamento de dados de expressão gênica temporal a dados em painel

    Get PDF
    O objetivo deste trabalho foi determinar a melhor alternativa, entre os métodos de agrupamento hierárquico (Ward) e de otimização (Tocher), para a formação de grupos homogêneos de séries de expressão gênica, e realizar previsões quanto à expressão gênica dessas séries, a partir de pequeno número de observações temporais. Os dados utilizados referem-se à expressão de genes que atuam sobre o ciclo celular de Saccharomyces cerevisiae e corresponderam a 114 séries de expressão gênica, cada uma com dez valores de “fold-change” (medida da expressão gênica) ao longo do tempo (0, 15, 30, 45, 60, 75, 90, 105, 120 e 135 min). As estimativas dos parâmetros dos modelos autorregressivos AR(p) foram previamente ajustadas a séries individuais (de cada gene) de dados “microarray time series” e utilizadas, como variáveis, no processo de agrupamento. As previsões da expressão gênica foram feitas dentro de cada grupo formado, a partir dos ajustes no modelo AR(p) para dados em painel. O método de Ward foi o mais apropriado para a formação de grupos de genes com séries homogêneas. Uma vez obtidos esses grupos, é possível ajustar o modelo AR(2) para dados em painel e predizer a expressão gênica em um tempo futuro (135 min), a partir de um pequeno número de observações temporais (os outros nove valores de “fold-change”).The objective of this work was to determine the best alternative for the formation of homogeneous groups of gene expression series among the hierarchical clustering (Ward) and optimization (Tocher) methods, and to perform predictions regarding the gene expression of these series from a small number of temporal observations. The data used refer to the expression of genes that act on cell cycle of Saccharomyces cerevisiae, and corresponded to 114 gene expression series, with ten-fold-change values (expression measure) each, over time (0, 15, 30, 45, 60, 75, 90, 105, 120, and 135 min). The parameter estimates of autoregressive models AR(p) were previously adjusted to individual series (from each gene) of microarray time series data and used as variables in the clustering process. Gene expression predictions were made within each formed group from the adjustments in AR(p) model for panel data. The Ward’s method was the more suited for the formation of gene groups with homogeneous series. Once these groups are obtained, it is possible to adjust the model AR(2) for panel-data, and successfully predict gene expression at a future time (135 min) from a small number of temporal observations (the nine other fold-change values)

    TÉCNICAS DA ESTATÍSTICA ESPACIAL NA ANÁLISE DE DADOS DE ÁREAS NO ESTUDO DA DENGUE

    Get PDF
    A análise espacial tem se destacado na literatura oferecendo critérios quantitativos de agrupamento e dispersão dos dados, permitindo, entre outras coisas, a determinação da dependência espacial entre observações, além da identificação de regiões em que a doença, em estudo, apresenta comportamento semelhante. Neste trabalho, foram utilizadas diferentes técnicas da estatística espacial na análise de dados de áreas, objetivando encontrar a melhor técnica de análise. Para ilustrar a metodologia, foram analisados os casos de dengue ocorridos na cidade de Lavras - MG, no período de 2007 a 2010. Esse período corresponde ao primeiro surto da doença registrado na cidade. Os resultados da pesquisa apontaram a estatística Scan Espaço-Temporal como a melhor técnica, cujas vantagens incluem a possibilidade de localizar as áreas de maior risco de surto epidêmico

    Forecasting the number of vehicles thefts in Campinas/Brazil using a Generalized Linear Autoregressive Moving Average model

    Get PDF
    By definition, thefts are considered the act of taking away other people's mobile possessions for personal use or for others, affecting crime rates, economic indicators and enabling recent studies to create risk zones in society, contributing to insurance pricing in actuarial methods. This paper analyzes the number of vehicle thefts of 38 locations near Campinas/São Paulo, Brazil, using a GLARMA(p,q) model with Poisson and Negative Binomial response. The main feature of GLARMA(p,q) is to consider the peculiarities of counting data as high dispersion. As a result, it was possible to verify the adequacy and usefulness of the model for counting data. With specific techniques for estimating time series related to the public security area, patterns can be better understood, revealing relevant information that can be added to decision-making processes to direct public policies

    Analysis of Count Time Series: A Bayesian GARMA(p, q) Approach

    Get PDF
    Extensions of the Autoregressive Moving Average, ARMA(p, q), class for modeling non-Gaussian time series have been proposed in the literature in recent years, being applied in phenomena such as counts and rates. One of them is the Generalized Autoregressive Moving Average, GARMA(p, q), that is supported by the Generalized Linear Models theory and has been studied under the Bayesian perspective. This paper aimed to study models for time series of counts using the Poisson, Negative binomial and Poisson inverse Gaussian distributions, and adopting the Bayesian framework. To do so, we carried out a simulation study and, in addition, we showed a practical application and evaluation of these models by using a set of real data, corresponding to the number of vehicle thefts in Brazil

    Abordagem Bayesiana da curva de lactação de cabras Saanen de primeira e segunda ordem de parto

    Get PDF
    The objective of this work was to use the Bayesian method in the fitting of the Wood´s model for milk production of Saanen goats. Two groups of animals from first and second lactation were considered in the analysis. The posterior marginal distributions for each parameter and production functions, peak milk yield, time of peak yield, persistency and total milk production, were obtained via Gibbs Sampler algorithm. The inference was done for each population. The results showed differences in the slope of the curve after the peak and in persistency, indicating highest production for the second lactation. The data were simulated for evaluating Bayesian method under several covariance matrices structures. The simulation results indicate the efficiency of this method for lactation curves studies when the covariance matrices show high correlation for parameters.O objetivo deste trabalho foi utilizar o método Bayesiano no ajuste do modelo de Wood a dados de produção de leite de cabras da raça Saanen. Dois grupos de animais da primeira e segunda lactação foram considerados. Amostras das distribuições marginais a posteriori dos parâmetros do modelo de Wood e das funções de produção derivadas desses parâmetros – pico de produção, tempo do pico de produção, persistência e produção total de leite – foram obtidas pelo algoritmo Gibbs Sampler. As inferências foram feitas em cada população e os resultados mostraram diferenças na taxa de decréscimo da produção após o pico e na persistência, indicando maior produção nos animais de segunda lactação. Realizou-se um estudo de simulação de dados para avaliar o método Bayesiano sob diferentes estruturas de matrizes de covariâncias dos parâmetros. Os resultados desse estudo indicam que o método é eficiente no estudo das curvas de lactação quando a matriz de covariância apresenta alta correlação dos parâmetros

    Análise do comportamento temporal dos preços da borracha natural no mercado internacional

    Get PDF
    This work analyzed the behavior of natural rubber prices in the international market from January 1982 to December 2006 in function of its aggregated demand and supply, pointing out the main producing and consuming countries. Specifically, the research studied the evolution of prices and of the marketed quantum of natural rubber in the international market. It was characterized,  identified, estimated and analyzed models for the real monthly prices series of raw rubber RSS 1 (US/t),andtheaccuracyoftheestimatedmodelsforforecastingpricesofthiscommoditywastestedfromJan/2006toDez/2006.ThestudiedmodelswereofARIMAARCHclass.Themainresultswere: therealnaturalrubberpricespresenteddecreasingtendencyintheperiodbeingstudied;theARIMAfamilyestimatedmodelindicatingtheexistenceofheteroskedasticityintheseries,makingitnecessarytoidentify,toestimateandtoanalyzethemodelsofARCHfamily;themodelwhichbestadjustedthereturnsofthepriceseriesoftherawrubberRSS1wasAR(1)GARCH(1,1);themodelsoftheARIMAfamilydidntsatisfytheprognosisconditionsoftheseriesbeingstudied;theAIR(1)GARCH(1,1)modelwasaccurateforforecastingrubberprices.Estetrabalhoanalisouocomportamentodosprec\cosdaborrachanaturalnomercadointernacional,noperıˊododejaneirode1982adezembrode2006,emfunc\ca~odesuaofertaedemandaagregadas,evidenciandoosprincipaispaıˊsesprodutoreseconsumidores.Especificamenteapesquisaanalisouaevoluc\ca~odosprec\cosedoquantumcomercializadodaborrachanaturalnomercadointernacional.Caracterizou,identificou,estimoueanalisoumodelosparaaseˊriedeprec\cosreaismensaisdaborrachacruaRSS1(US/t), and the accuracy of the estimated models for forecasting prices of this commodity was tested from Jan/2006 to Dez/2006. The studied models were of ARIMA-ARCH class. The main results were:  the real natural rubber prices presented decreasing tendency in the period being studied; the ARIMA family estimated model indicating the existence of heteroskedasticity in the series, making it necessary to identify, to estimate and to analyze the models of ARCH family; the model which best adjusted the returns of the price series of the raw rubber RSS1 was AR(1)-GARCH(1,1); the models of the ARIMA family didn't satisfy the prognosis conditions of the series being studied; the AIR (1)-GARCH (1,1) model was accurate for forecasting rubber prices.Este trabalho analisou o comportamento dos preços da borracha natural no mercado internacional, no período de janeiro de 1982 a dezembro de 2006, em função de sua oferta e demanda agregadas, evidenciando os principais países produtores e consumidores. Especificamente a pesquisa analisou a evolução dos preços e do quantum comercializado da borracha natural no mercado internacional. Caracterizou, identificou, estimou e analisou modelos para a série de preços reais mensais da borracha crua RSS 1 (US/t) e; testou a precisão dos modelos estimados na previsão dos preços dessa commodity, no período de jan./2006 a dez./2006. Os modelos estudados foram das classes ARIMA-ARCH. Os principais resultados encontrados foram: 0s preços reais da borracha natural, no período estudado, apresentam tendência decrescente; A identificação e estimação dos modelos da família ARIMA mostraram a existência de heteroscedasticidade na série estudada e a necessidade de identificar, estimar e analisar os modelos da família ARCH; O modelo que melhor ajustou os retornos da série de preços da borracha crua RSS 1 foi o AR(1) para um GARCH(1,1); Os modelos da família ARIMA não satisfizeram as condições de previsão da série estudada; o modelo AR (1)-GARCH (1,1) se mostrou preciso para a realização de prognoses do preço da borracha

    Análise Bayesiana do modelo auto-regressivo para dados em painel: aplicação na avaliação genética de bovinos de corte

    Get PDF
    A previsão dos valores genéticos de animais em tempos futuros constitui importante inovação tecnológica para a área de Zootecnia, uma vez que possibilita planejar com antecedência o descarte ou a manutenção de animais no rebanho. No presente estudo considerou-se uma análise Bayesiana de modelos auto-regressivos de ordem p, AR(p), para dados em painel, de forma a utilizar a função de verossimilhança exata, a análise de comparação de distribuições a priori e a obtenção de distribuições preditivas de dados futuros. A metodologia utilizada foi testada mediante um estudo de simulação usando a priori hierárquica Normal multivariada-Gama inversa (modelo 1), a priori independente t-Student Gama inversa (modelo 2) e a priori de Jeffreys (modelo 3). As comparações entre os modelos, realizadas por meio do Pseudo-Fator de Bayes, indicaram uma superioridade do modelo 2 em relação aos demais. Realizou-se uma aplicação em resultados reais referentes as DEP de touros da raça Nelore, sendo que, em média, a eficiência de previsão dos valores de DEP para um ano futuro foi próxima de 80%. Constatou-se considerável vantagem da metodologia proposta em relação a metodologia frequentista usual, uma vez que a implitude dos intervalos de credibilidade de 95% foram muito menores que aquelas apresentadas pelos intervalos de confiança assintóticos.The animal breeding values forecasting at futures times is a relevant technological innovation in the field of Animal Science, since its enables a previous indication of animals that will be either kept by the producer for breeding purposes or discarded. This study discusses an MCMC Bayesian methodology applied to panel data in a time series context. We consider Bayesian analysis of an autoregressive, AR(p), panel data model of order p, using an exact likelihood function, comparative analysis of prior distributions and predictive distributions of future observations. The methodology was tested by a simulation study using three priors: hierarchical Multivariate Normal-Inverse Gamma (model 1), independent Multivariate Student's t Inverse Gamma (model 2) and Jeffrey's (model 3). Comparisons by Pseudo-Bayes Factor favored model 2. The proposed methodology was applied to longitudinal data relative to Expected Progeny Difference (EPD) of beef cattle sires. The forecast efficiency was around 80%. Regarding the mean width of the EPD interval estimation (95%) in a future time, a great advantage was observed for the proposed Bayesian methodology over usual asymptotic frequentist method

    Bayesian comparison of forecasting models to expected progenies difference in Nelore cattle genetic breeding

    Get PDF
    O objetivo deste trabalho foi realizar uma análise bayesiana de modelos auto-regressivos de ordem p, AR(p), para dados em painel referentes às diferenças esperadas nas progênies (DEP) de touros da raça Nelore publicados de 2000 a 2006. Neste trabalho, adotou-se o modelo AR(2), indicado pela análise prévia da função de autocorrelação parcial. As comparações entre as prioris, realizadas por meio do Fator de Bayes e do Pseudo-Fator de Bayes, indicaram superioridade da priori independente t-Student multivariada – Gama inversa em relação à priori hierárquica Normal multivariada – Gama inversa e a priori de Jeffreys. Os resultados indicam a importância de se dividir os animais em grupos homogêneos de acordo com a acurácia. Constatou-se também que, em média, a eficiência de previsão dos valores de DEP para um ano futuro foi próxima de 80%.The objective of this work was to accomplish a bayesian analysis of an autoregressive, AR(p), panel data model from Nelore sires' expected progenie difference (EPD) observed during 2000–2006. The AR(2) model was used due to the results of partial autocorrelation function analysis. The prior comparisons were performed through Bayes Factor and Pseudo-Bayes Factor, and the results showed the independent t-Student multivariate – inverse Gamma superiority in relation to the hierarchical multivariate Normal – inverse Gamma and Jeffreys prior. Results indicate the importance of sires grouping by accuracy values, and also show forecast efficiency around 80%
    corecore